遗传分析方法的GPU并行计算与优化研究

遗传分析方法的GPU并行计算与优化研究

作者:师大云端图书馆 时间:2015-10-18 分类:毕业论文 喜欢:1730
师大云端图书馆

【摘要】这篇博士论文主要研究基于混合线性模型遗传分析方法的GPU并行计算及优化。随着新一代测序技术的出现,不但给统计遗传学带来了很多新的机遇,而且在数据处理上也带来了巨大的挑战。新一代测序技术使得生物数据爆炸式增长,数据规模的增长速度已经超过了计算机硬件的发展速度,目前dbSNP公布已确认的人类SNP个数已超过五千三百万,如果采用直接分析SNP之间的互作,则已经超过peta量级的测试。本论文中,我们提出了基于“组学”数据的关联分析GPU并行方法,并采用了基于GPU与CPU的异构并行计算模式。此外,本论文在并行优化方面还设计了基于任务的自适应负载均衡方法,开发了基于混合线性模型的系数矩阵压缩方法,采用了基于索引节点的优化方法,使用了细化并行粒度的循环渗透方法。论文共分四章。第一章引导和概述了统计遗传的发展历程及分析方法。介绍了新一代测序技术带来的机遇与挑战,特别阐述了GPU并行技术,从GPU计算的工作原理,GPU的体系结构,GPU线程的执行模式到GPU的存储器模式。最后,简要阐述了混合线程模型及方差组分估计,固定效应估计和随机效应估计的方法。第二章主要介绍了经典数量遗传分析方法的GPU并行及优化策略。首先介绍了经典数量遗传分析中我们采用的方法,适用于我们提出的各个模型,包括农艺性状模型,种子模型,动物模型及区域实验模型等。重点介绍了经典数量遗传分析方法的GPU并行实现。讨论了所采用的优化技术,包括指令优化,显存空间的优化,显存访问的优化及程序结构的优化。最后介绍了采用GPU加速的经典数量遗传分析软件QGAStation2.0。第三章主要介绍了基于“组学”数据的关联分析方法及其GPU并行优化策略,包括上位性分析,基因环境互作分析的回归模型及其GPU并行优化。基因组的SNP标记数据与转录组、蛋白组和代谢组的表达量数据在数据类型上可以是不一样的。标记数据一般用整型表示,表达量数据一般用浮点型表示。所以首先介绍了基于基因组SNP数据的分析方法,并讨论了该类数据的并行及优化策略。其次介绍了有关转录组,蛋白质组和代谢组数据的分析方法,并讨论了该类数据的并行及优化策略。最后介绍了我们开发的一种新型的基于组学数据关联分析的软件(QTXNetwork)。该软件功能强大,不仅可以分析早期生物标记数据,而且可以分析高通量序列数据及全部“组学”数据,并采用多GPU并行加速。第四章总结和归纳了在并行及优化中所用的关键技术。首先简单介绍了我们提出了和采用的关键技术和方法。随后分别阐述在经典数量遗传分析中所采用的关键技术,在组学数据分析中所采用的关键技术。最后讨论了做好并行计算及优化需要具备的条件。
【作者】张福涛;
【导师】朱军;
【作者基本信息】浙江大学,生物信息学,2014,博士
【关键词】复杂性状;GPU;GWAS;上位性;基因与环境互作;混合线性模型;

【参考文献】
[1]苏影.5-8岁儿童基于事实的解释性心理理论的发展研究[D].东北师范大学,发展与教育心理学,2012,硕士.
[2]黄飞雪.墨润苍雄 沉浑高洁[D].渤海大学,美术学,2013,硕士.
[3]刘儒军.面向再制造的铁磁性构件疲劳损伤磁记忆检测[D].合肥工业大学,机械工程,2013,硕士.
[4]王洋.《书谱》书学思想与对后世书法实践关系研究[D].曲阜师范大学,汉语言文字学,2013,硕士.
[5]李忠献,吕杨,徐龙河,丁阳.强震作用下钢-混凝土结构弹塑性损伤分析[J].天津大学学报(自然科学与工程技术版),2014,02:101-107.
[6]熊多.论湘西影视剧的地域文化表征[D].西南交通大学,传播学,2014,硕士.
[7]揭骏仁.智慧电厂的物联网环境监测平台[D].北京交通大学,通信与信息系统,2013,硕士.
[8]杨冰.胡锦涛群众观研究[D].河北大学,马克思主义基本原理,2014,硕士.
[9]陈姝.利恒公司ERP系统设计与实践[D].吉林大学,软件工程,2012,硕士.
[10]石文雅.我国政府间税收竞争问题研究[D].东北财经大学,财政学,2003,硕士.
[11]高蒙.以魔幻现实主义解读拉什迪《午夜的孩子》[D].四川外国语大学,比较文学与世界文学,2013,硕士.
[12]冯世敬.天然纤维复合PVFM悬浮填料的制备及其在污水处理中的应用[D].郑州大学,环境工程,2013,硕士.
[13]朱明明.语音情感识别方法及其应用研究[D].安徽大学,计算机应用技术,2013,硕士.
[14]赵炜.从关联理论视角分析幽默言语翻译的可译性限度[D].扬州大学,外国语言学及应用语言学,2011,硕士.
[15]张晓晖.机器人视觉伺服及网络控制研究[D].西安理工大学,2009.
[16]黎永冰.林农合作何以可能[D].华中师范大学,政治学理论,2013,硕士.
[17]张元宇.社会资源优化配置理论下医师多点执业的法律规制[D].吉林大学,社会医学与卫生事业管理,2013,硕士.
[18]杜彩萍.唐山市中国现代诗歌选修课程现状与反思[D].河北师范大学,学科教学,2012,硕士.
[19]蔺大勇.我国结构性减税政策的效应分析及路径选择[D].吉林财经大学,财政学,2014,硕士.
[20]徐嘉莉.Web使用模式挖掘在个性化远程教育中的应用[J].福建电脑,2005,10:20-21.
[21]王永昌.谈饲料厂通风除尘[J].饲料工业.2006(17)
[22]部国光,张书联,周健伟.轧机机座刚度计算软件开发[J].一重技术.1997(04)
[23]虞鸿,吴哲夫,刘恺,何熊熊.一种从物体表面法线估计高度信息的算法[J].计算机科学,2013,05:311-314.
[24]殷帅.无刷直流电机做电动汽车驱动电机时转矩脉动降低方法[D].中北大学,车辆工程,2014,硕士.
[25]李平.长波长InGaAs/InPSAGM雪崩光电二极管最佳工作特性[J].光通信研究.1990(02)
[26]云智汉.深层孔隙型热储地热尾水回灌堵塞机理及示踪技术研究[D].长安大学,地下水科学与工程,2014,硕士.
[27]朱婧茜.智能手机滑动解锁的可用性研究与应用[D].湖南大学,设计艺术学,2014,硕士.
[28]刘莎.胡梅尔《#f小调钢琴奏鸣曲》的技术特征和演奏处理[D].武汉音乐学院,音乐与舞蹈学,2013,硕士.
[29]许晓龙.资本嵌入差异下的村庄社会管理[D].华中师范大学,政治学理论,2013,硕士.
[30]王海军.当前解放军连队思想政治教育的问题及对策研究[D].西南大学,思想政治教育,2013,硕士.
[31]蔡潜,蔡秋霞,庄桂林,钟兴,王新德,李小年,王建国.脱质子化1,3环加成石墨烯外在固定位上的贵金属纳米线(英文)[J].物理化学学报,2014,04:640-645.
[32]严涛.曲线连续刚构桥结构行为及施工控制分析[D].西南交通大学,建筑与土木工程,2012,硕士.
[33]汪思.英语代词“It”与汉语表达“它”的比较研究[D].哈尔滨工业大学,外国语言学及应用语言学,2014,硕士.
[34]崔晓燕.基于CUDA的指纹识别加速算法的研究[D].大连海事大学,电子科学与技术,2013,硕士.
[35]冯蕾,严雪芳.基于模糊语言学的第二语言教学[J].湖北社会科学,2015,02:177-180.
[36]李冰洁.我国A股上市公司送转股行为的市场反应和影响研究[D].浙江工业大学,2013.
[37]谢献娜.杂多化合物负载钌双功能催化剂催化纤维素转化[D].天津大学,化学工艺,2013,硕士.
[38]秦怡安(PornthawanChanchitsophon).中国女性问题研究[D].复旦大学,中国语言与文化,2012,硕士.
[39]赵跃宏.影响产后盆底功能障碍产科因素的前瞻性研究[D].南方医科大学,围产医学(专业学位),2014,博士.
[40]刘颖,林元烈,覃征.含先验信息的学习机在生物序列分析中的应用[J].计算机应用,2005,09:2169-2170.
[41]朱晓峰,张薇.信息无障碍标准研究近况[J].互联网天地.2007(01)
[42]黄金龙.bola型两亲性分子的自组装及调控[D].杭州师范大学,高分子化学与物理,2013,硕士.
[43]高君兰.难治性癫痫的危险因素分析[D].大连医科大学,神经病学,2012,硕士.
[44]杨欢.基于ADAMS的三臂并联机器人动力学研究[D].中北大学,机械设计及理论,2014,硕士.
[45]韩家金.东软汽车导航中动态交通信息服务的设计与实现[D].东北大学,计算机应用技术,2010,硕士.
[46]强军锋,田欣伟,王晓刚,樊子民,任建勋,邓军平,余竹焕.新型煤气化炉内温度场影响因素研究[J].煤炭转化.2006(02)
[47]谭长森.农民工住房解决方式的影响因素研究[D].兰州大学,社会学,2013,硕士.
[48]朱志飞.MDH、LDHC基因多态性与肉鸽生长及繁殖性状的相关性分析[D].扬州大学,动物生殖调控应用与研究,2011,硕士.
[49]刘生峰.植酸酶基因在毕赤酵母中高效表达及工程菌培养基初步优化[D].西南农业大学,微生物学,2004,硕士.
[50]闫伟平.氧化锌基纳米材料的制备及光电化学性质的研究[D].吉林大学,应用化学,2013,硕士.

相关推荐
更多